1
สถิติเป็นตัวแปรสุ่ม: การแจกแจงตัวอย่าง
MATH003Lesson 4
00:00
ในการสรุปทางสถิติ เราเริ่มจากการสังเกตจุดข้อมูลเดี่ยวๆ แล้วไปวิเคราะห์ **สถิติ** — ฟังก์ชันการแปลงเชิงฟังก์ชัน $Y = h(X_1, X_2, \dots, X_n)$ ของลำดับตัวอย่าง เนื่องจากตัวอย่างพื้นฐานประกอบด้วยตัวแปรสุ่ม ดังนั้นตัวสถิติเองก็เป็นตัวแปรสุ่ม และกฎความน่าจะเป็นของมันเรียกว่า **การแจกแจงตัวอย่าง**

สถิติในฐานะการแปลง

สถิติถูกนิยามอย่างเป็นทางการว่าเป็นฟังก์ชัน $h: \mathbb{R}^n \to \mathbb{R}$ เราจะกำหนดความน่าจะเป็นที่ตัวสถิติจะตกอยู่ในเซต $B$ โดยใช้ภาพกลับ (pre-image):

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

รากฐานของตัวแปรอิสระและเหมือนกัน (i.i.d.)

สำหรับตัวอย่างของตัวแปรสุ่มที่เป็นอิสระและมีการแจกแจงเหมือนกัน (i.i.d.) ความน่าจะเป็นร่วมของจุดตัวอย่างเฉพาะเจาะจง $(x_1, \dots, x_n)$ คือผลคูณของความน่าจะเป็นตามขอบเขต: $p(x_1)p(x_2)\dots p(x_n)$ ผลคูณนี้ทำหน้าที่เป็นน้ำหนักให้แต่ละจุดเมื่อคำนวณความน่าจะเป็นรวมที่ตัวสถิติจะมีค่าเฉพาะ

ตัวอย่าง 4.1.1: ค่าเฉลี่ยเรขาคณิต

พิจารณาประชากรแบบแยกประเภทที่ $p_X(1) = 1/2$, $p_X(2) = 1/4$, และ $p_X(3) = 1/4$ เราสุ่มตัวอย่างขนาด $n=2$ ($X_1, X_2$) และนิยามตัวสถิติของเราเป็นค่าเฉลี่ยเรขาคณิต: $Y_2 = (X_1 X_2)^{1/2}$

เพื่อหาการแจกแจงของ $Y_2$ เราจะแสดงรายการคู่ทั้งหมด 9 คู่ที่เป็นไปได้ $(X_1, X_2)$ คำนวณความน่าจะเป็นร่วม และค่า $Y_2$ ที่ได้มา:

คู่ $(x_1, x_2)$ความน่าจะเป็น $P(x_1)P(x_2)$$Y = \sqrt{x_1 x_2}$
(1, 1)1/41.000
(1, 2), (2, 1)1/8 + 1/8 = 1/41.414
(1, 3), (3, 1)1/8 + 1/8 = 1/41.732
(2, 2)1/162.000
(2, 3), (3, 2)1/16 + 1/16 = 1/82.449
(3, 3)1/163.000

การแจกแจงแบบแม่นตรงเทียบกับแบบเชิงเส้น

ก่อนที่จะไปสู่ทฤษฎีบทเชิงขีดจำกัด เช่น ทฤษฎีบทกลางของคลัสเตอร์ (CLT) เราต้องเข้าใจการแจกแจงแบบ "แม่นตรง" ก่อน ซึ่งเกี่ยวข้องกับการคำนวณฟังก์ชันมวลหรือความหนาแน่นของความน่าจะเป็นเฉพาะสำหรับตัวสถิติเมื่อมี $n$ ที่เล็กและจำกัด เมื่อรูปแบบเชิงวิเคราะห์กลายเป็นเรื่องยาก เราจะใช้การจำลองเชิงตัวเลข เช่น **การประมาณแบบมอนต์คาร์โล**

หลักการสำคัญ
การแจกแจงตัวอย่างคือการแจกแจงของตัวแปรสุ่มที่สัมพันธ์กับฟังก์ชันของลำดับที่เป็นอิสระและเหมือนกัน (i.i.d.) มันเป็นสะพานเชื่อมระหว่างข้อมูลดิบและกระบวนการอนุมานทางวิทยาศาสตร์